Yiksan0315's Blog

RNN language model

# Tag:

  • Source/KU_ML2

RNN language model

RNN을 사용해 다음 단어를 예측하는 model.

보통 문법적으로 맞는지, 틀린지 예측하게 하기에는 supervised learning하기 힘들다. 그래서 보통 다음 단어가 나올 확률을 얻어내는 방식으로 전환해 사용한다.

의 식을 따르며, log likelihood가 커지도록 학습한다.

이외에 LSTM을 이용해 하는 방식도 존재하며, Gradient Vanishing 문제로 보통 LSTM을 사용한다.

어떤 한 단어가 input으로 들어가고, hidden state로부터 output이 만들어지고, 해당 output이 다시 input으로 들어가는 방식으로 문장을 생성한다.

활용

  • 확률이 작은 부분을 oversampling하여 문법적으로 틀리지만, 시적으로 허용되는 문장을 만들 수도 있다.
  • 확률이 높은 단어를 oversampling하여 보통 확률을 높이는 방식을 이용한다.
toc test

이 페이지는 리디주식회사에서 제공한 리디바탕 글꼴이 사용되어 있습니다. 리디바탕의 저작권은 리디주식회사가 소유하고 있습니다.

This Font Software is licensed under the SIL Open Font License, Version 1.1.

Copyright 2025. yiksan0315 All rights reserved.